AI资讯新闻榜单内容搜索-Claude 3.5

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Claude 3.5
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM

菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM

菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM

LLM能否解决「狼-山羊-卷心菜」经典过河难题?最近,菲尔兹奖得主Timothy Gowers分享了实测GPT-4o的过程,模型在最简单的题目上竟然做错了,甚至网友们发现,就连Claude 3.5也无法幸免。

来自主题: AI资讯
8395 点击    2024-07-01 12:21
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点

Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点

Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点

想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等技术正是由此产生的灵感。

来自主题: AI技术研报
7383 点击    2024-06-29 00:14
陈丹琦团队图表解读新基准:新王Claude3.5刚及格,但已是模型最强推理表现

陈丹琦团队图表解读新基准:新王Claude3.5刚及格,但已是模型最强推理表现

陈丹琦团队图表解读新基准:新王Claude3.5刚及格,但已是模型最强推理表现

Claude 3.5 Sonnet的图表推理能力,比GPT-4o高出了27.8%。 针对多模态大模型在图表任务上的表现,陈丹琦团队提出了新的测试基准。 新Benchmark比以往更有区分度,也让一众传统测试中的高分模型暴露出了真实能力。

来自主题: AI技术研报
8497 点击    2024-06-29 00:07
Glif 的作者五分钟做了个 AI 梗图生成器,结果风靡推特。

Glif 的作者五分钟做了个 AI 梗图生成器,结果风靡推特。

Glif 的作者五分钟做了个 AI 梗图生成器,结果风靡推特。

推特上有这么一个作者,今天早上只用了五分钟,使用了 Claude 3.5、ComfyUI、JSON 提取器等模块,搭建了个生成 meme 梗图的生成器,截止目前已经 157.3w 人看过。

来自主题: AI资讯
4651 点击    2024-06-27 17:37
GPT-5一年半后拥有「博士级智能」,Claude 3.5首超人类博士!全知全能ASI将成人类「新神」?

GPT-5一年半后拥有「博士级智能」,Claude 3.5首超人类博士!全知全能ASI将成人类「新神」?

GPT-5一年半后拥有「博士级智能」,Claude 3.5首超人类博士!全知全能ASI将成人类「新神」?

OpenAI CTO Murati表示,GPT-5将在一年半后发布,在某些领域将达到博士的智能;而Claude 3.5 Sonnet,已经成为了第一个测试分数高于最聪明的人类博士的模型。当AGI进一步发展为ASI,它会因为接近神性的全知、全能、无所不在,而被人类敬奉为「新神」吗?当ASI给出一张「希特勒名单」,人类又将怎样?

来自主题: AI资讯
8475 点击    2024-06-22 22:14
超越GPT-4o,Claude 3.5一夜封王!10倍编码速度逆天,全网最全实测来了

超越GPT-4o,Claude 3.5一夜封王!10倍编码速度逆天,全网最全实测来了

超越GPT-4o,Claude 3.5一夜封王!10倍编码速度逆天,全网最全实测来了

昨夜上线的Claude 3.5 Sonnet,性能直接吊打了GPT-4o,甚至价格还更便宜。网友们纷纷展开实测,有人表示自己一半的工作已经可以由它替代了!而最让人惊喜的新功能,莫过于Artifacts了。

来自主题: AI资讯
8314 点击    2024-06-21 20:56